Classificador de Poemas 

Paulo A. Araiijo'*' e Nuno J. Mamede ( *' 

(t) L 2 F / Instituto Superior de Engenharia de Lisboa 

R. Conselheiro Emideo Navarro, 1, 1949-014 Lisboa 

E-mail: paraujo@isel.pt , Telefone: 218317217, Fax: 218317114 

( )L 2 j? / instituto Superior Tecnico 

Rua Alves Redol, 9, 1000-029 Lisboa 

E-mail: Nuno.Mamede@inesc-id.pt , Telefone: 213100367, Fax: 213145843 

Resumo. Descreve-se um classificador para poemas da poetica portuguesa. A classificacao dos poemas e realizada 
com base nos conceitos de estrofe, verso, silaba e rima definidos no diciondrio de termos literdrios [1] e no diciondrio 
de literatura [2] . Foi implementado um conjunto de regras que tern em conta o niimero de versos por estrofe, o 
numero de silabas de cada verso e a rima utilizada. 

O prototipo desenvolvido agrega um modulo que contem o lexico, um modulo que realiza a interface com uma 
aplicacao externa que gera transcricoes foneticas e gera divisoes sildbicas das palavras, e 3 modulos funcionais. 

Sao utilizadas tecnicas de processamento da lingua natural para realizar a correccao ortogrdfica do poema, tendo 
tambem sido desenvolvidos algoritmos para classificar os poemas. 

E feita uma avaliacao do prototipo descrito, utilizando diferentes tipos de poemas. Por ultimo sao apresentadas 
algumas conclusoes relativamente as potencialidades e limitacoes do classificador descrito. 

1. Motiva?ao 

Cada vez mais se utilizam ferramentas de apoio a escrita, como por exemplo os correctores ortograficos e 
gramaticais. A sua utilizacao reflecte-se quer na qualidade final dos documentos quer nas facilidades que 
proporcionam. Os poemas podem ser considerados um caso mais especifico de documentos em que a sua 
estrutura e regras de construcao sao mais rigidas. 

Para a lingua Portuguesa nao foram encontradas ferramentas para tratamento de poemas. No entanto foram 
encontradas paginas na internet onde e possivel ler e discutir poesia. Tambem para a lingua inglesa existem 
este tipo de paginas na internet mas tambem existem outras onde e possivel jogar com palavras. O "The 
Gardener Kit" [3] e um jogo de palavras em que o objectivo final e a construcao de poemas. Este jogo 
corresponde a uma versao para a internet inspirada na versao original "Magnetic Poetry" de Dave Kapell [4]. 
Tambem foram encontrados sistemas mais complexos que permitem a geracao automatica de poesia como e 
o caso do "Ray Kurzweil's Cybernetic Poet" [5] embora neste caso se utilizem modelos de linguagem para 
representacao de poemas pre-fornecidos. 

A motivacao para a realizacao deste trabalho foi a implementacao de um sistema capaz de classificar poemas 
e servir de incentivo para a realizacao, leitura e estudo da poesia. Podera ser utilizado como uma ferramenta 



didactica de apoio ao estudo de poesia nas escolas, para poetas que realizam poesia, e que poderao ver 
algumas das tarefas de verificacao dos poemas simplificadas e, ainda, como auxiliar de leitura em voz alta de 
poemas. 



2. Arquitectura 

A arquitectura agrega um processo central que e responsavel por coordenar os varios modulos que comp5em 
o prototipo construido. Foi inspirada na plataforma Galaxy-II [6] e e resumida na Figura 1. 




Classificador 
de Poemas 



W Identificador ^M 
^^^ Regras ^^ 





Figura 1 - Arquitectura do prototipo realizado. 

O modulo que realiza a interface com a aplicacao externa designa-se por modulo de interface externa (MIE). 
A aplicacao externa gera transcrigoes foneticas e divisoes sildbicas e o seu funcionamento esta baseado no 
sistema DIXI [7] que tern como base um sistema de regras. Este modulo tem duas funcoes principais que 
podem ser aplicadas a uma palavra ou a um conjunto de palavras. Uma funcao invoca os procedimentos 
necessarios para realizar a transcricao fonetica, e a outra para realizar a divisao silabica. 

O modulo que realiza interface com o lexico designa-se por modulo de interface do lexico (MIL). O lexico 
inclui as transcrigoes foneticas e as divis5es silabicas fornecidas pela aplicacao externa e a qual se acrescenta 
informacao adicional para facilitar o processo de classificagao. 

O modulo que realiza a interface com o utilizador designa-se por modulo de interface do sistema (MIS). As 
operacoes de interface com o utilizador incluem a edigao de poemas, guardar e ler em ficheiros os poemas 
editados e recepcao dos comandos do utilizador para validagao de vocabulario e para classificagao dos 
poemas. 

O modulo que identifica os conceitos da poetica portuguesa, designa-se por modulo identificador de 
conceitos (MIC), e responsavel por reconhecer e assinalar num poema os conceitos estruturais e a rima do 
poema. 

O modulo que atribui a classificagao final do poema designa-se por modulo identificador de regras (MIR). 
Este modulo implementa um conjunto de regras de classificagao. 



O processo coordenador dos modulos foi designado por processo classificador depoemas (PCP). 

3. Implementa^ao 

O PCP realiza a classificacao de poemas em 4 etapas. Na primeira etapa, o MIS e responsavel por realizar a 
aquisicao do poema para uma estrutura interna e armazena o poema num formato que identifica as linhas do 
poema e destaca as palavras finais dos versos. Este formato simplifica a etapa de classificacao seguinte. 
Pode, opcionalmente, ser realizada a verificacao de vocabulario do poema, utilizando as func5es do MIL, 
para garantir que as palavras que compSem o poema existem no lexico. Se tal nao acontecer, as palavras em 
falta podem ser acrescentadas ao lexico utilizando funcoes do MIE. 

Na segunda etapa o MIC acrescenta a informacao de identificacao de conceitos. Esta informacao inclui a 
identificacao das estrofes, dos versos e das rimas. Tambem e acrescentada a informacao da transcricao 
fonetica e divisao silabicas das palavras. 

Na terceira etapa o MIR realiza a classificacao do poema com base em regras que incluem a classificacao das 
estrofes, a classificacao dos versos e a classificacao da rima. Tern ainda como base a informacao de 
identificacao de conceitos da etapa anterior. 

Na quarta e ultima etapa, o MIS e responsavel por apresentar o resultado final de classificacao ao utilizador. 

3.1. Identificacao dos Conceitos de Poema, Estrofe e Verso 

O MIC identifica os conceitos de poema, poesia, estrofe e verso. As defmic5es que foram usadas para definir 
estes conceitos podem ser analisados a 2 niveis que correspondem ao detalhe e a objectividade da defmicao. 
Vox poema entende-se "um organismo verbal que contem, suscita ou segrega poesia" [1]. Como a definicao 
de poema esta baseada na definicao de poesia entao para poesia adoptou-se a seguinte defmicao: 

"Se eu chamar prosa a um discurso minimo, veiculo mais economico do pensamento, e chamar, a, b, c, a 
atributos particulares da linguagem, inuteis mas decorativos, tais como o metro, a rima ou o ritual das 
imagens, toda a superficie das palavras se encaixard na dupla equagdo de M. Jourdain: 

Poesia = Prosa + a + b + c 

Prosa = Poesia - a - b - c 
Dai resulta evidentemente que a Poesia e sempre diferente da Prosa. Mas tal diferenga nao e de essencia, e 
de quantidade" [1]. 

Pode-se concluir destas duas defmicoes que poesia e diferente de prosa e essa diferenca encontra-se nos 
atributos particulares da linguagem, tais como o metro e a rima. Daqui resulta o primeiro compromisso em 
relacao a implementacao destes conceitos que restringe o dominio dos poemas que podem ser analisados pois 
apenas se consideram poemas validos aqueles em que existe poesia. 

Os conceitos de estrofe e verso estao relacionados com a estrutura do poema. "Por estrofe entende-se cada 
uma das secgoes que constituem um poema, ou seja cada agrupamento de versos, rimados ou nao, com 
unidade de conteudo e de ritmo" [1]. "Verso e a sucessao de silabas ou fonemas formando unidade ritmica e 
melodica, correspondente a uma linha do poema. Cada verso subdivide-se ainda em sub unidades 



caracterizadas pelo agrupamento de silabas chamado de pe na versificagdo greco-latina" [1]. A partir das 
duas defini95es apresentadas se conclui que um poema esta organizado em secedes que se designam de 
estrofes e as linhas do poema sao designadas por versos. A Figura 2 mostra a estrutura de um poema. 
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Figura 2 - Estrutura do poema 

O algoritmo que implementa a identificacao dos conceitos e resumido na Tabela 1. Este algoritmo esta 

implementado no MIC. Comeca por iniciar as variaveis numEstrofe e numVerso com para depois realizar 

um ciclo de leitura das linhas do poema. Por cada linha lida incrementa a variavel numVerso que indica o 

numero de versos numa estrofe. Por cada mudanca de linha em branco no texto e incrementada a variavel 

numEstrofe que indica o numero de estrofes. Por cada mudanca de estrofe e iniciada a variavel numVerso 

com 0. 

Tabela 1 - Algoritmo de identificacao de Conceitos 

// Inicia variaveis 

numEstrofe=0 

numVerso=0 

// Inicia estrutura interna 

NovoPoema(); 

// Ciclo de identificacao de conceitos 

while((txtLinha=bufRead.readLine())!=null){ 

// ... pre processamento da linha 

if(txtLinha.compareTo("")!=0) 

{// caso a linha nao seja nula 
numVerso=numVerso+1 // incrementa o n° verso 
Processa(txtLinha, numVerso) 

} 

else { // caso a linha seja nula 
if(numVerso>0) { // salta linhas brancas consecutivas 
// incrementa o numero de estrofe 
numEstrofe=numEstrofe+1 ; 
ActualizaEstrofe(numEstrofe, numVerso); 
// actualiza a estrofe e reinicia o numVerso 
numVerso=0; 
} 
} 
} 



3.2. Identificacao de Rima 

A Identificacao da Rima tambem e realizada pelo MIC e realiza-se em duas fases. A primeira fase e realizada 
na instrucao "Processa(txtLinha, numVerso)" que faz parte do algoritmo da Tabela 1. Esta instrucao 
decompoe cada linha do poema em palavras, e para a ultima palavra acrescenta a informacao adicional 
necessaria para a rima. A segunda fase e realizada no fim da aquisicao do poema e e feita da seguinte forma. 
Comecando pela ultima palavra do 1° verso do poema, atribui-se a letra A a essa palavra. Para todas as 



palavras fmais dos versos do poema que rimem com essa palavra, tambem se atribui a mesma letra. Procura- 
se a proxima palavra final que ainda nao tenha letra associada e atribui-se outra letra, por exemplo B e 
repete-se sucessivamente este procedimento ate todas as palavras finais terem letra atribuida. 

O conceito de rima foi defmido a partir da seguinte forma: "Depara-se-nos uma rima (final) quando, em 
duas ou mais palavras, a ultima vogal acentuada, com tudo o que se Ihe segue, tern identica sonoridade" [1]. 
A Figura 3 esquematiza a definicao apresentada. 
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Figura 3 - Rima 

A comparacao sonora das palavras e realizada com baase na transcricao fonetica das palavras. A aplicacao 
externa utiliza o alfabeto fonetico SAM-PA para realizar as trancricoes foneticas. 

A titulo de exemplo as palavras 'traducao' e 'abalaram' tern a transcricao fonetica respectivamente de 
[tr6dus"6~w~] e [6b61"ar6~w~]. Estas traduc5es correspondem a transcricao fonetica no alfabeto fonetico 
SAM-PA e a vogal tonica e precedida do caracter "". Para verificar se duas palavras rimam basta comparar 
as transcric5es foneticas a partir do caracter "". 



3.3. Regras de classificacao de Poemas 

O modulo MIR realiza a classificacao dos poemas com base em regras. Para isso foram implementadas um 
conjunto de tabelas de classificacao a partir das quais se classifica os poemas. O numero de versos em cada 
estrofe condiciona a classificacao das estrofes que comp5em o poema. O numero total de silabas de cada 
verso pode variar ao longo do poema. Consoante o numero de silabas que comp5em o verso assim se obtem 
diferentes tipos de verso. A escolha das palavras finais e a forma como a rima e enlacada define o tipo de 
rima utilizada. 

Comecando pela classificacao das estrofes quanto ao numero de versos a Tabela 2 mostra as varias 
designacoes de classificacao possiveis e a designacao escolhida: 

Tabela 2 - Classificacao das estrofes quanto ao n" de versos 

N° de DesignacSes possiveis Designacao 
Versos Adoptada 



monotico 

distico, parelha ou pareado 

tristico ou terceto 

tetrastico, quadra ou quarteto 

pentastico, quinteto ou quintilha 

hexastico, sextilha, sexteto ou septena 



monotico 

parelha 

terceto 

quadra 

quinteto 

sexteto 



heptastico, setima, septilha, septena ou hepteto setima 



8 octastico ou oitava oitava 

9 nona, eneagesima ou novena nona 

1 decastico, decada ou decima decima 

n n versos n versos 

Devido a necessidade de utilizacao de apenas uma das designacao na classificacao de poemas, foi escolhida a 
mais comum. A linha n corresponde a uma generalizacao no caso do numero de versos de uma estrofe ser 
maior que 10 e generaliza os restantes casos. 

A proxima classificacao depende do numero de silabas que existe em cada verso, e para cada caso tambem se 
existem varias designacoes possiveis. A Tabela 3 resume os casos possiveis. 

Tabela 3 - Classificacao dos versos quanto ao n" de versos 

N° de DesignacSes possiveis Designacao 
Silabas Adoptada 

1 1 silaba 1 silaba 

2 dissilabo ou bissilabo bissilabo 

3 trissilabo, quebrado de redondilha maior, redondilho quebrado ou cola trissilabo 

4 Tetrassilabos tetrassilabos 

5 pentassilabo ou redondilha menor pentassilabo 

6 hexassilabo, heroico quebrado ou heroico menor hexassilabo 

7 heptassilabo ou redondilha maior heptassilabo 

8 Octossilabo octossilabo 

9 eneassilabo, verso de gregorio de matos eneassilabo 

10 decassilabo, heroico, safico ou provencal decassilabo 

1 1 hendecassilabo ou verso de arte maior hendecassilabo 

1 2 alexandrino alexandrino 
m m silabas m silabas 
20 vintissilabos vintissilabos 

n n silabas n silabas 

Tambem neste caso se adoptou a designacao mais comum para ser utilizada. As linhas men correspondem a 
generalizacao para os casos que em que o numero de versos nao se encontra na tabela e que correspondem 
aos valores entre 13 e 19 e aos maiores que 20. 

A ultima palavra de cada verso determina o tipo de rima utilizado. Existem tres tipos possiveis de 
classificacao que sao resumidas na Tabela 4: 

Tabela 4 - Classificacao quanto ao tipo de rima 

DesignacSes possiveis Designacao adoptada 

oxitona ou aguda aguda 

paroxitona ou grave grave 

proparoxitona ou esdruxula esdriixula 

Tambem aqui o criterio de escolha para a designacao a adoptar foi a que e mais usual. 

Para classificar a posicao relativa dos versos e a forma como estao enlacados foi realizada a Tabela 5 com as 
varias hipoteses possiveis: 

Tabela 5 - Classificacao quanto a posicao relativa dos versos que enlaca 

Enlace da Rima Designacao 

Quando os versos que rimam se encontram juntos e aos pares emparelhadas 

(ABB CDD EFF) 

Quando entre dois versos que rimam se encontra outro de cruzadas 

diferente rima (ABCB ou ABAB) 

Quando entre dois versos que rimam se encontram dois versos de abracadas 
diferente rima (ABBA ou ABCA) 
Quando entre dois versos que rimam se encontram tres ou mais interpolada 



versos de diferente rima (ABBBA ou ABCDA) 

Quando rimam mais de dois versos seguidos (AAA) 

Quando esta sujeito a uma so rima que pode tambem ser cruzada 

(ABCB) 



seguida 
monorrimos 



4. Exemplo de Classificacao 

4.1. Tipos de Poemas 

Assume-se como diferentes tipos de poemas, poemas que apresentem diferentes hipoteses de classificacao 
nas tabelas apresentadas. 

Para exemplificar diferentes tipos de poemas, foram utilizados poemas com diferentes proveniencias, sendo 
o primeiro exemplo 2 quadras populares de Antonio Aleixo, o segundo exemplo 1 estrofe dos lusiadas e o 
terceiro exemplo duas estrofes realizadas por criancas em idade escolar. 



4.2. Resultados de Classificacao 

Na Tabela 6 apresentam-se os exemplos de classificacao dos poemas. 

Tabela 6 - Classificacao de Poemas 



Poemas 



Eu nao tenho vistas largas, 
Nem grande sabedoria, 
Mas dao-me as horas amargas 
LicSes de Filosofia. 

Ha luta por mil doutrinas. 
Se querem que o mundo ande, 
Facam das mil pequeninas 

Uma so doutrina grande. 

As armas e os baroes assinalados 
Que da ocidental praia lusitana 
Por mares nunca de antes navegados 
Passaram ainda alem da Taprobana, 
Em perigos e guerras esforcados 
Mais do que prometia a forca humana, 
E entre gente remota edificaram 
Novo Reino, que tanto sublimaram; 
menina que leva a vida 
sentadinha a escrever, 
faca favor de ensinar, 
eu tambem quero aprender. 



ClassificacSes 



Brincar, brine ar 
es para brincar 
e alegrar 



Classificacao do Poema 
Resumo 
linhas: 9 ; versos: 8 ; estrofes: 2 
silabas: [8,8,8,8,0,8,9,8,8] 
rimas: [A,B,A,B, ,C,D,C,D] 
Classificacao das estrofes 
l a estrofe - quadra [4 versos] - rima cruzada 
2 a estrofe - quadra [4 versos] - rima cruzada 

Classificacao do Poema 
Resumo 

linhas: 8 ; versos: 8 ; estrofes: 1 

silabas: [12,12,12,13,12,13,13,11] 

rimas: [A,B,A,B,A,B,C,C] 
Classificacao por estrofes 
l a estrofe - oitava [8 versos] - rima cruzada, 

rima emparelhada. 

Classificacao do Poema 
Resumo 

linhas: 8 ; versos: 7 ; estrofes: 2 

silabas: [9,8,8,8,0,4,5,4] 
rimas: [A,B,C,B, ,C,C,C] 
Classificacao por estrofes 
l a estrofe - quadra [4 versos] - rima cruzada 
2 a estrofe - terceto [3 versos] - rima seguida 



O resultado de classificacao divide-se em duas partes. Na primeira parte e feito um resumo do poema onde se 
pode verificar que o numero de linhas total do poema, o numero de versos e o numero de estrofes. O resumo 
inclui tambem a informacao do numero de silabas em cada verso do poema e ainda o enlace da rima. Na 
segunda parte e feita a classificacao das varias estrofes que compoem o poema. 



A informacao de classificacao das estrofes inclui a classificacao quanto ao numero de versos e quanto a rima 
utilizada. Podem existir varias hipoteses de rima na mesma estrofe. 

Existe uma opcao de classificacao que permite aumentar o detalhe de classificacao. A Tabela 7 mostra o 
resultado que se obteria para a primeira quadra do primeiro exemplo apresentado. 

A informacao de detalhe mostra a classificacao de cada verso quanto ao numero de silabas e quanto ao tipo 
da ultima palavra. Inclui ainda o enlace da rima e o tipo de rima. 

Tabela 7 - Detalhe de classificacao 

1 a estrofe - quadra [4 versos] - rima cruzada 

1° Verso - octossilabo [8 silabas] - grave - A 

2° Verso - octossilabo [8 silabas] - grave - B 

3° Verso - octossilabo [8 silabas] - grave - A 

4° Verso - octossilabo [8 silabas] - grave - B 

5. Conclusoes 

Em relacao aos objectivos iniciais, o prototipo realiza a classificacao de diferentes tipos de poema sem ser 
necessario a partida fornecer exemplos de poemas. 

Utiliza-se o mesmo processo de classificacao para classificar os diferentes tipos de poemas e com diferentes 
proveniencias. 

A medida que se foram fazendo experiencias de classificacao com diferentes tipos de poesia, apenas no 
inicio se notou mais a falta de vocabulario no lexico que, a medida que foi sendo acrescentada fez diminuir 
as palavras em falta. 

Para poemas mais extensos nota-se que a performance do sistema diminui devido ao aumento do numero de 
palavras que obrigam a um maior processamento. 
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